Using distributed word representations for robust semantic role labeling (Utilisation de représentations de mots pour l'étiquetage de rôles sémantiques suivant FrameNet) [in French]
نویسندگان
چکیده
Résumé. D’après la sémantique des cadres de Fillmore, les mots prennent leur sens par rapport au contexte événementiel ou situationnel dans lequel ils s’inscrivent. FrameNet, une ressource lexicale pour l’anglais, définit environ 1000 cadres conceptuels couvrant l’essentiel des contextes possibles. Dans un cadre conceptuel, un prédicat appelle des arguments pour remplir les différents rôles sémantiques associés au cadre. Nous cherchons à annoter automatiquement ces rôles sémantiques, étant donné le cadre sémantique et le prédicat, à l’aide de modèles à maximum d’entropie. Nous montrons que l’utilisation de représentations distribuées de mots pour situer sémantiquement les arguments apporte une information complémentaire au modèle, et améliore notamment l’étiquetage de cadres avec peu d’exemples d’entrainement. Abstract. According to Frame Semantics (Fillmore 1976), words’ meaning are best understood considering the semantic frame they play a role in, for the frame is what gives them context. FrameNet defines about 1000 such semantic frames, along with the roles arguments can fill in this frame. Our task is to automatically label arguments’ roles, given their span, the frame, and the predicate, using maximum entropy models. We make use of distributed word representations to improve generalisation over the few training exemples available for each frame. Mots-clés : rôles sémantiques ; représentations distribuées ; maximum d’entropie.
منابع مشابه
New Word Vector Representation for Semantic Clustering
RÉSUMÉ. L’idée que nous défendons dans cet article est qu’il est possible d’obtenir des concepts sémantiques significatifs par des méthodes de classification automatique. Pour ce faire, nous commençons par proposer des mesures permettant de quantifier les relations sémantiques entre mots. Ensuite, nous utilisons les méthodes de classification non supervisée pour construire les concepts d’une ma...
متن کاملTowards automatic cross-lingual transfer of semantic annotation
In order to develop a semantic labeling system, the most common methods use supervised learning from an annotated corpus. What if we have short deadlines and limited human and financial possibilities that prevent us from building such a training corpus for our language? If such a corpus already exists for any other language, this paper proposes a method to automatically import the existing corp...
متن کاملModeling Semantic Memory
Computational models of semantics infer semantic structure from the analysis of large linguistic corpora. Two approaches are described here. In each case the data consist of a document-by-word matrix, counting the number of times a word was used in a document. Latent Semantic Analysis uses dimension reduction to construct a high-dimensional semantic space from such a matrix. Information in sema...
متن کاملEvent Role Labelling using a Neural Network Model (Étiquetage en rôles événementiels fondé sur l'utilisation d'un modèle neuronal) [in French]
Information Extraction systems must cope with two problems : they heavily depend on the considered domain but the cost of development for a domain-specific system is important. We propose a new solution for role labeling in the event-extraction task that relies on using unsupervised word representations (word embeddings) as word features. We automatically learn domain-relevant distributed repre...
متن کاملIdentifier la cible des émotions dans les forums de santé
Résumé : Les forums de santé en ligne sont des espaces d’échanges où les patients partagent leurs sentiments à propos de leur(s) maladie(s), traitement(s), etc. Sous couvert d’anonymat, ils expriment très librement leurs expériences personnelles. Ces forums sont donc une source d’informations très utile pour les professionnels de santé afin de mieux identifier et comprendre les problèmes, les c...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2014